#rmarkdown::render(“ClusteringCoseq.Rmd”)

On cherche à construire un réseau de régulation, sur les gènes qui ont été détectés comme différentiellement exprimés lors du traitement au KNO3 des plantes WT.

Etude de la quantification

Il semble qu’il y ait beaucoup de gènes ambigus pour htseq-count : cela se produit quant une coordonnée génomique chevauche plusieurs gènes. Peut être qu’on a de grands reads, et qu’ils chevauchent souvent les UTR des autres?

On refait l’analyse avec un autre pipeline (Cutadapt, Hisat2, Stringtie) et on observe la somme des counts par échantillons.

On en conclue que Stringtie ne s’embête pas et compte les reads chevauchants pour chaque partie chevauchée, expliquant ce plus grand nombre de reads quantifiés.

On affiche la même chose pour mon htseq-count sur l’alignement de Hisat2 :

On compare htseq-count avec l’option nonunique all, qui doit faire comme stringtie.

On essaie de faire un mapping plus stringent avec STAR en autorisant que deux mismatchs, mais on a des résultats très très similaires :

La seule différence est qu’on a supprimé les outliers supérieurs dans la quatégorie des gènes quantifiés.

La bonne quantification

On a un soucis dans l’annotation : on a plusieurs features par transcrit! Les versions .1, .2, se chevauchaient tout le temps, problème repéré par visu dans igv. On choisit donc un seul transcrit par gène, et on re-quantifie.

Homogénéité des réplicats : significativité

On cherche maintenant à voir si ces plots montrent suffisamment corrélés pour montrer que les réplicats au sein d’une même condition sont suffisamment similaires. On peut déjà vérifier en plottant deux réplicats de conditions différentes : on voit que le scatter plot est plus dispersé que les réplicats biologiques.

Nous pouvons donc en conclure que nous réplcats on bien été labelisés, et qu’ils sont plus homogènes au sein d’une même condition qu’entre différentes conditions de la combinatoire. Il semblerait que nous puissions passer à la suite : analyse stat pour l’expression différentielle.

 

A work by Océane Cassan

oceane.cassan@supagro.fr